Comment ameliorer la supervision et la performance du SI des entreprises

Les entreprises rencontrent souvent des problèmes de performance du système d’information qui impactent le bon déroulement de leurs activités. La raison ? Les outils de monitoring et de reporting ne traitent que partiellement les informations de surveillance de la performance réseau et applicative.

Les systèmes d’information reposent de plus en plus sur des modèles hybrides mêlant infrastructure classique et solutions cloud. Grâce au big data et à l’AIOps, il est possible de disposer d’un modèle de supervision au service du contrôle de la performance : visibilité transverse, prédictivité et adaptation à l’activité de l’entreprise.

Visibilité transverse à l’ensemble du SI

Pourquoi ? Pour analyser de manière globale l’origine des incidents afin d’en identifier la cause et mettre en place une action corrective plus rapidement. Il faut pour cela analyser toutes les couches constituant le système d‘information : infrastructure, réseau, applications et expérience utilisateur.

Comment faire ? En agrégant et corrélant toutes les informations provenant des outils de monitoring en temps réel. Cela permet de centraliser tous les évènements liés au SI et leurs impacts sur l’activité de l’entreprise.

Quel résultat pour le service support ? Un gain de productivité dans la gestion opérationnelle, c’est-à-dire :

  • Réduction du nombre de tickets d’incidents : pour un même problème, l’entreprise évite la multiplication des tickets créés. Aujourd’hui, 20% à 30% des incidents créés automatiquement à partir des informations de monitoring sont redondants.
  • Gain de temps dans la résolution des incidents : grâce à l’identification rapide des causes racines (root cause) des incidents
80% des incidents générant des problèmes de performance ne font pas l’objet d’une correction effective par manque d’informations.
 

Une visibilité transverse permet donc de gommer la disparité qui règne parmi tous les outils de monitoring,généralement mono-services. Aujourd’hui, identifier la cause racine des pannes ou des baisses de performance est complexe. L’écosystème informatique est constitué de différents services interconnectés et interdépendants, reposant sur une prolifération d’outils de monitoring et de tableaux de bord avec une visibilité parcellaire. Cette situation n’aide pas à détecter et corriger les incidents, surtout dans les zones d’ombres non couvertes par les outils.

Prédictivité des problèmes

Pourquoi ? Pour adopter une démarche proactive de la gestion des incidents et se prémunir des problèmes par le déploiement d’actions préventives.

Comment faire ? En adoptant un modèle d’Intelligence Artificielle pour les Opérations Informatiques, ou AIOps. Celui-ci permet de stocker, combiner et analyser en temps réel les données récoltées des outils de monitoring déployés par l’entreprise et des règles de corrélation (tel que le Machine Learning), et donc de générer des alertes intelligentes.

Quel résultat pour le service support ? L’anticipation des aléas techniques, répétitifs ou non, qui pourraient nuire à l’activité de l’entreprise :

  • Diminution du nombre d’incidents. L’entreprise évite toute situation de dégradation, voire de saturation.
  • Identification de toute diminution des performances, des accès aux applications, cloud, voix, etc, grâce à l’exploitation et la corrélation des informations relatives à leur fonctionnement. L’entreprise évite une dégradation avant même qu’elle ne soit sensible pour les utilisateurs.
  •  Identification des points à améliorer. Avec l’historique et l’évolution des données, des tendances matures sont créées de manière à déterminer les besoins d’adaptation du SI.
70% des DSI sont informés des problèmes de performance par les utilisateurs finaux (source : Gartner)
 

Grâce à la prédiction des problèmes, l’entreprise évite les situations critiques pour son activité.. L’historique des évènements lui permet d’analyser l’origine des problèmes et d’éviter que ces derniers ne se répètent. Aujourd’hui, 70% des SI sont informés par les utilisateurs finaux des problèmes de performance après leur apparition et, le temps de trouver l’origine, la situation est très souvent revenue à la normale, rendant la gestion des problèmes complexe.

Modèle de supervision adaptée

Pourquoi ? Pour tenir compte de l’activité de l’entreprise dans la surveillance des différents sites, services, applications métiers…et répondre au mieux aux impératifs de son business. Par exemple, les applications bureautiques seront plus critiques sur les positions de travail administratives et commerciales qu’en magasin.

Comment faire ? En adaptant son modèle AIOps par la prise en compte de différents niveaux de criticité selon les sites et services monitorés. En fonction de l’impact des incidents sur l’activité de l’entreprise, il y aura une qualification et une priorisation des alertes plus pertinentes.

Quel résultat pour le service support ? Une amélioration de la prise de décision dans la gestion opérationnelle de son SI :

  • Un système d’information au service de l’activité : suivre la performance du réseau et le bon fonctionnement des applications critiques à l’activité, surtout si cette dernière connait une saisonnalité.
  • Un système d’information adaptable en fonction des besoins : répondre, par exemple, à un accroissement de l’activité.

En intégrant les impératifs de son activité, l’entreprise personnalise son mode de supervision ou monitoring, et optimise la gestion de ses services informatiques critiques :

  • un site d’e-commerce pour une entreprise de vente en ligne,
  • une application de gestion des stocks pour un distributeur du commerce de détail
  • une application de planification des interventions pour les techniciens sur le terrain…

En conclusion

En adoptant ces 3 principes - visibilité transverse, prédictivité des problèmes, modèle de supervision adaptée - suivre la performance de son SI devrait ainsi être simplifié, et assurer la continuité des activités de l’entreprise.

300x300_mathieu.chapuis.png
Mathieu Chapuis

Business Developer au sein de la Direction des Grands Comptes pour les services de monitoring et d’AIOps, j’accompagne les équipes de compte et nos clients dans leurs projets d’innovation et de déploiement autour de ces services à forte valeur ajoutée.